<<<<<<< HEAD ======= >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392 Instacart - parte 1 <<<<<<< HEAD <<<<<<< HEAD ======= >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Pedidos

======= // check for a valueOutputSpan if (valueOutputSpan.length > 0) { handleValueOutput(valueOutputSpan); } // if we have a shinyOutput then bind a listener to handle // new valueOutputSpan values shinyOutput.on('shiny:value', function(event) { var element = $(event.target); setTimeout(function() { var valueOutputSpan = element.find('span.value-output'); if (valueOutputSpan.length > 0) handleValueOutput(valueOutputSpan); }, 10); } ); } });

Intro

Row

TRUE

TRUE

Mercado

Row

TRUE

TRUE

Row

De pessoas

2 Milhões

Gastos em supermercado por ano por pessoa

R$ 5000

De potencial

10 Bilhões

Persona

Persona

TRUE

TRUE

Pesquisa

Persona

TRUE

TRUE

Pedidos

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Row

Clientes no grupo recorrente

33 758
<<<<<<< HEAD

Média de compras por cliente

=======

Compras por cliente

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
35.9
<<<<<<< HEAD

Média de dias entre compras

=======

Dias entre compras

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
7
<<<<<<< HEAD

Ticket Médio

=======

Produtos na cesta

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
7.1
<<<<<<< HEAD
=======
>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Row

Clientes no grupo alvo

15 248
<<<<<<< HEAD

Média de compras por cliente

=======

Compras por cliente

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
3.3
<<<<<<< HEAD

Média de dias entre compras -box}

=======

Dias entre compras

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
28.4
<<<<<<< HEAD

Ticket Médio

=======

Produtos na cesta

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
3.3
<<<<<<< HEAD
=======
>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Row

Distribuição

<<<<<<< HEAD
======= TRUE >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

TRUE

<<<<<<< HEAD ======= >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392 <<<<<<< HEAD

Frequência

TRUE

======= >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
<<<<<<< HEAD

Departamentos

Row

Análise 1

Produtos e Carrinho de Compras

=======

Produtos

>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Heatmap - Consumidores Churn

<<<<<<< HEAD TRUE ======= TRUE >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

TRUE

  • 1 Sparkling Water
  • 2 Sweet Kale Salad Mix
  • 3 Red Onion
  • 4 Pure Irish Butter
  • 5 Bunched Cilantro
  • 6 Baby Cucumbers
  • 7 Roma Tomato
  • 8 Fat Free Milk
  • 9 Garlic
  • 10 Natural Spring Water
  • 11 Vanilla Almond Breeze Almond Milk
  • 12 Organic Extra Virgin Olive Oil
  • 13 Packaged Grape Tomatoes
  • 14 Jalapeno Peppers
  • 15 Orange Bell Pepper
  • 16 Sharp Cheddar Cheese
  • 17 Smartwater
  • 18 Roasted Pine Nut Hummus
  • 19 Sparkling Mineral Water
  • 20 Cereal
  • 21 Extra Fancy Unsalted Mixed Nuts
  • 22 Green Onions
  • 23 Organic Low Fat Milk

  • HIPÓTESE:

  • <<<<<<< HEAD
  • Existe uma relação entre a posição do produto no carrinho e a recorrência de compra

  • PREMISSA DA ANÁLISE:

Separar os clientes em 2 catergorias: Clientes Churn e clientes muito recorrentes. Essa definição inicial é feita com base na variável ‘days_since_pior_order’. Primeiro se calcula a média móvel a cada 5 compras, por user_id. Uma vez definidas as médias móveis por cliente, calculam-se os quartis.

  • Clientes Churn:

    • Clientes < 5 compras: Média simples >=25 dias

    • Clientes >= 5 compras: Última média móvel = 30

  • Clientes Recorrentes: aqueles que estão acima da mediana.

Definido isso, será feita uma análise para cada um dos grupos de modo a buscar as discrepâncias.

  • GRÁFICOS: Foram criados 2 Heatmaps, um para cada grupo de clientes, onde são apresentados os percentuais de recorrencias de produtos (100 produtos de maior recorrência de compra), nas diferentes posições do carrinho de compras.

  • =======
  • Relação entre a posição do produto no carrinho e a recorrência de compra

  • PREMISSA DA ANÁLISE:

Categorias:

  • Clientes Churn:

    • Clientes < 5 compras: Média simples >= 25 dias

    • Clientes >= 5 compras: Última média móvel = 30

  • >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
  • INSIGHTS:

  • Clientes em Churn tem um perfil de compra muito diferente do grupo recorrente.

  • Média de Produtos na cesta: Churn = 3,32 | Recorrentes = 7,13

  • Tipos de produtos na cesta:

      <<<<<<< HEAD
    • Churn: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho

      • Atenção para o alto percentual desses produtos na primeira posição da cesta.

      • Há vários produtos que nunca apareceram em lugares mais altos da cesta. Sugere que não fazem compras, e sim pedem produtos avulsos.

    • Recorrentes: Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho

      • Muito mais orgânicos
      • =======
      • Churn: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho

        • Alto percentual desses produtos na primeira posição da cesta.

        • Produtos que nunca apareceram em lugares mais altos da cesta: Sugere que não fazem compras, e sim pedem produtos avulsos.

        • >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
<<<<<<< HEAD
=======
>>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

Heatmap - Consumidores Recorrentes

<<<<<<< HEAD TRUE ======= TRUE >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

TRUE

  • 1 Organic Kiwi
  • 2 Organic D’Anjou Pears
  • 3 Organic Garnet Sweet Potato (Yam)
  • 4 Organic Navel Orange
  • 5 100% Raw Coconut Water
  • 6 Organic Bartlett Pear
  • 7 Grated Parmesan
  • 8 Grape White/Green Seedless
  • 9 Extra Virgin Olive Oil
  • 10 Organic Sticks Low Moisture Part Skim Mozzarella String Cheese
  • 11 Organic Milk
  • 12 Organic Large Brown Grade AA Cage Free Eggs
  • 13 Clementines, Bag
  • 14 Granny Smith Apples
  • 15 Organic Fat Free Milk
  • 16 Total 2% with Strawberry Lowfat Greek Strained Yogurt
  • 17 Bartlett Pears
  • 18 Organic Carrot Bunch
  • 19 Pure Sparkling Water
  • 20 Whipped Cream Cheese
  • 21 Shredded Parmesan
  • 22 Organic Broccoli Florets
  • 23 Organic Black Beans

  • HIPÓTESE:

  • <<<<<<< HEAD
  • Existe uma relação entre a posição do produto no carrinho e a recorrência de compra

  • PREMISSA DA ANÁLISE:

Separar os clientes em 2 catergorias: Clientes Churn e clientes muito recorrentes. Essa definição inicial é feita com base na variável ‘days_since_pior_order’. Primeiro se calcula a média móvel a cada 5 compras, por user_id. Uma vez definidas as médias móveis por cliente, calculam-se os quartis.

  • Clientes Churn:

    • Clientes < 5 compras: Média simples >=25 dias

    • Clientes >= 5 compras: Última média móvel = 30

  • Clientes Recorrentes: aqueles que estão acima da mediana.

Definido isso, será feita uma análise para cada um dos grupos de modo a buscar as discrepâncias.

  • GRÁFICOS: Foram criados 2 Heatmaps, um para cada grupo de clientes, onde são apresentados os percentuais de recorrencias de produtos (100 produtos de maior recorrência de compra), nas diferentes posições do carrinho de compras.

  • INSIGHTS:

  • Clientes em Churn tem um perfil de compra muito diferente do grupo recorrente.

  • Média de Produtos na cesta: Churn = 3,32 | Recorrentes = 7,13

  • Tipos de produtos na cesta:

    • Churn: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho

      • Atenção para o alto percentual desses produtos na primeira posição da cesta.

      • Há vários produtos que nunca apareceram em lugares mais altos da cesta. Sugere que não fazem compras, e sim pedem produtos avulsos.

    • Recorrentes: Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho

      • Muito mais orgânicos

Dendro Clientes Churn

=======
  • Relação entre a posição do produto no carrinho e a recorrência de compra

  • PREMISSA DA ANÁLISE:

  • Clientes Recorrentes: aqueles que estão acima da mediana de quantidade de pedido.

  • INSIGHTS:

    Recorrentes:

    • Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho

    • Muito mais orgânicos

  • Corredores

    Churn

    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    <<<<<<< HEAD TRUE ======= TRUE >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

    TRUE

    <<<<<<< HEAD

    Dendro Clientes Recorrentes

    =======

    Recorrentes

    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    <<<<<<< HEAD TRUE ======= TRUE >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392

    TRUE

    <<<<<<< HEAD

    Pesquisa

    =======

    Próximos Passos

    Possibilidades

    TRUE

    TRUE

    Perguntas

    Perguntas

    TRUE

    TRUE

    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    ---
    title: "Instacart - parte 1"
    <<<<<<< HEAD
    author: "Leonardo Giovanelli, Marcelo Franceschini, Rafael Costa, Sérgio Gomes, Viviane Sanchez"
    date: '`r Sys.Date()`'
    institute: "PADS - Insper"
    =======
    #author: "Leonardo Giovanelli, Marcelo Franceschini, Rafael Costa, Sérgio Gomes, Viviane Sanchez"
    #date: '`r Sys.Date()`'
    #institute: "PADS - Insper"
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    encoding: "UTF-8"
    output: 
     flexdashboard::flex_dashboard:
        #storyboard: true
        orientation: rows
        social: menu
        source_code: embed
    <<<<<<< HEAD
    =======
        theme: lumen
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
        #logo: img/carrot-orange.png
    ---
    
    ```{r setup, include=FALSE, fig.align = 'center'}
    knitr::opts_chunk$set(echo = FALSE, fig.cap = TRUE)
    
    # Pacotes---------------------------------------------------
    
    library(flexdashboard)
    library(plotly)
    library(tidyverse)
    library(skimr)
    library(inspectdf)
    library(ggrepel)
    library(ggthemes)
    library(grid)
    library(lubridate)
    library(grid)
    library(plotly)
    library(RcppRoll)
    library(extrafont)
    library(factoextra)
    library(dendextend)
    library(knitr)
    
    # Identidade visual---------------------------------------------------
    
    #font_import()
    #fonts()
    
    theme_set(theme_minimal())
    theme_update(text = element_text(family = "Brandon Text"),
                 plot.title = element_text(face = "bold"))
    
    source('instacart_palette.R')
    
    options(pillar.sigfig = 1)
    ```
    
    
    ```{r Importa, include=FALSE, fig.align = 'center'}
    # Arquivos ---------------------------------------------------
    
    arquivos <- list.files(path = 'data/', 
                           pattern = "*.csv",
                           full.names = TRUE) %>% sort()
    
    aisles_raw <- read_csv(arquivos[1])
    
    departments_raw <- read_csv(arquivos[2])
    
    op_prior_raw <- read_csv(arquivos[3])
    
    op_train_raw <- read_csv(arquivos[4])
    
    orders_raw <- read_csv(arquivos[5])
    
    products_raw <- read_csv(arquivos[6])
    ```
    
    ```{r Persona, include=FALSE, fig.align = 'center'}
    # Persona ---------------------------------------------------
    
    
    
    ```
    
    
    ```{r Tratamentos, include=FALSE, fig.align = 'center'}
    # Pedidos --------------------------------------
    
    orders <- orders_raw %>% 
      mutate(order_hour_of_day = as.numeric(order_hour_of_day))
    
    # Feature Engineering
    
    orders <- orders_raw %>% 
      filter(eval_set != 'test') %>% 
      filter(order_number != 1) %>% 
      arrange(user_id, order_number) %>% 
      mutate(order_hour_of_day = as.numeric(order_hour_of_day),
             w_day = wday(if_else(order_dow == 0, 7, order_dow), label = TRUE)
             #days_since_prior_order = if_else(is.na(days_since_prior_order), 0,
                                              #days_since_prior_order)
             ) %>% 
      group_by(user_id) %>% 
      mutate(days_ma = roll_mean(days_since_prior_order, 5, fill = NA, na.rm = T)) %>% 
      ungroup()
    
    ## Média Móvel
    
    hist_ma <- orders %>% 
      na.omit() %>% 
      ggplot(aes(x = days_ma)) +
      geom_bar(fill = ic_cols('dark-green')) +
      geom_vline(xintercept = 8, color = ic_cols('orange'), 
                 linetype = 'dashed', size = 0.8, show.legend = TRUE) +
      scale_y_continuous(label = scales::label_number_si()) +
      labs(title = 'Distribuição da média móvel de dias entre os últimos 5 pedidos',
           x = 'Dias desde o último pedido', y = '')
    
    ## Grupo de usuários
    
    orders_count <- orders %>% 
      #filter(days_since_prior_order < 30) %>% 
      group_by(user_id) %>% 
      count() %>% 
      transmute(compras = n)
    
    
    orders2 <- orders %>% 
      left_join(orders_count, by = 'user_id') %>% 
      mutate(abaixo_10 = if_else(compras <= 10, 'Menos de 10 pedidos', 'Mais de 10 pedidos'),
             grupo = case_when(days_ma <= 8 ~ 'Recorrente',
                               days_ma < 30 ~ 'Alvo',
                               days_ma >= 30 ~ 'Indefinido',
                               is.na(days_ma) ~ 'Indefinido'),
             grupo = factor(grupo, levels = c('Recorrente', 'Alvo' , 'Indefinido'), ordered = TRUE))
    
    orders_grouped <- orders2 %>% 
      group_by(w_day, order_hour_of_day, grupo, abaixo_10) %>% 
      summarise(avg_compras = mean(compras, na.rm = T),
                avg_days = mean(days_since_prior_order, na.rm = T))
    
    ### Grupos
    
    ### Value boxes
    
    orders_vb <- orders2 %>% 
      group_by(grupo, abaixo_10) %>% 
      summarise(avg_compras = mean(compras, na.rm = T),
                avg_days = mean(days_since_prior_order, na.rm = T))
    
    ## Recorrente
    
    vb_recorrente <- orders2 %>% 
      filter(grupo == 'Recorrente', abaixo_10 == 'Mais de 10 pedidos') %>%
      group_by(user_id) %>% 
      nrow()
    
    vb_means_recorrente <- orders_vb %>% 
      filter(grupo == 'Recorrente', abaixo_10 == 'Mais de 10 pedidos')
    
    ## Alvo
    
    vb_alvo <- orders2 %>% 
      filter(grupo == 'Alvo', abaixo_10 == 'Menos de 10 pedidos') %>%
      group_by(user_id) %>% 
      nrow()
    
    vb_means_alvo <- orders_vb %>% 
      filter(grupo == 'Alvo', abaixo_10 == 'Menos de 10 pedidos')
    
    
    ### Heatmatps
    
    hm_total <- orders2 %>% 
      group_by(w_day,order_hour_of_day ) %>% 
      summarise(avg_days = mean(days_since_prior_order, na.rm = T)) %>% 
      ggplot(aes(y = w_day, x = order_hour_of_day, fill = avg_days)) +
      geom_tile() +
      #scale_fill_viridis_c() +
      scale_fill_instacart(discrete = FALSE, palette = 'greens', reverse = TRUE) +
      labs(title = 'Frequência de pedidos (Total)' ,
           y = 'Dia da semana', x = 'Horário', fill = 'Dias desde a última compra')
    
    hm_alvo <- orders_grouped %>% 
      filter(grupo == 'Alvo', abaixo_10 == 'Menos de 10 pedidos') %>% 
      ggplot(aes(y = w_day, x = order_hour_of_day, fill = avg_days)) +
      geom_tile() +
      #scale_fill_viridis_c() +
      scale_fill_instacart(discrete = FALSE, palette = 'greens', reverse = TRUE) +
      labs(title = 'Frequência de pedidos do grupo alvo' ,
           y = 'Dia da semana',x = 'Horário', fill = 'Dias desde a última compra')
    
    hm_recorrente <- orders_grouped %>% 
      filter(grupo == 'Recorrente', abaixo_10 == 'Mais de 10 pedidos') %>% 
      ggplot(aes(y = w_day, x = order_hour_of_day, fill = avg_days)) +
      geom_tile() +
      #scale_fill_viridis_c() +
      scale_fill_instacart(discrete = FALSE, palette = 'greens', reverse = TRUE) +
      labs(title = 'Frequência de pedidos de clientes recorrentes' ,
           y = 'Dia da semana', x = 'Horário', fill = 'Dias desde a última compra')
    
    
    # Produtos ---------------------------------------------------
    
    # Juntandos bases com infos por id
    
    base_products_names <- products_raw %>% 
      left_join(aisles_raw) %>% 
      left_join(departments_raw) %>% 
      select(product_id, aisle_id, department_id, everything())
    
    # Juntandos bases com infos e base com todos os pedidos
    ```
    
    
    ```{r Carrinho, include=FALSE, fig.align = 'center'}
    # Carrinho ---------------------------------------------------
    
    # source('flex_files/flex_cart.R')
    
    
    # Pesquisa  ---------------------------------------------------
    
    #source('Pesquisa_Persona.Rmd')
    
    ```
    
    <<<<<<< HEAD
    =======
    Intro 
    =========================================
    Row
    -----------------------------------------------------------------------
    
    ```{r out.width = "87%", fig.align = "center"}
    
    include_graphics("img/ppt/Slide1.png")
    
    ```
    
    
    Mercado 
    =========================================
    Row
    -----------------------------------------------------------------------
    
    ```{r out.width = "87%", fig.align = "center"}
    
    include_graphics("img/ppt/Slide2.png")
    
    ```
    
    Row
    -----------------------------------------------------------------------
    
    ### De pessoas
    
    ```{r}
    
    n_pessoas <- 2
    
    valueBox(value = formatC(paste(n_pessoas, " Milhões"), format = 's'),
             icon = "fa-user",
             color = ic_cols("orange"))
    
    ?prettyNum
    
    ```
    
    ###  Gastos em supermercado por ano por pessoa
    
    ```{r}
    
    ticket <- 5000
    
    valueBox(value = formatC(paste("R$ ", ticket), format = 's'), 
             icon = "fa-shopping-cart",
             color = ic_cols("orange"))
    
    ```
    
    ### De potencial
    
    ```{r}
    
    n_pessoas <- 2
    ticket <- 5
    
    potencial <- n_pessoas*ticket
    
    valueBox(value = formatC(paste(potencial, " Bilhões"), format = 's'),
            #value = formatC(potencial, big.mark = " ", format = "f", flag = '#', digits = 0), 
             icon = "fa-money",
             color = ic_cols("green"))
    
    ```
    
    
    Persona 
    =========================================
    
    ### Persona
    
    ```{r}
    
    include_graphics("img/ppt/Slide3.png")
    
    ```
    
    
    Pesquisa 
    =========================================
    
    ### Persona
    
    ```{r}
    
    include_graphics("img/ppt/Slide4.png")
    
    ```
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    
    Pedidos
    =======================================================================
    
    Row
    -----------------------------------------------------------------------
    
    ### Clientes no grupo recorrente {.value-box}
    
    ```{r}
    
    recorr_n <- 33758
    valueBox(value = prettyNum(recorr_n, big.mark = " "), 
             icon = "fa-users",
             color = ic_cols("green"))
    
    ```
    
    
    <<<<<<< HEAD
    ### Média de compras por cliente {.value-box}
    =======
    ### Compras por cliente {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    recorr_mean_compra <- 35.9
    
    valueBox(value = round(recorr_mean_compra, 1), 
             icon = "fa-carrot",
             color = ic_cols("green"))
    
    ```
    
    
    <<<<<<< HEAD
    ### Média de dias entre compras {.value-box}
    =======
    ### Dias entre compras {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    recorr_mean_days <- 7.0
    
    valueBox(value = round(recorr_mean_days, 1), 
             icon = "ion-today-outline",
             color = ic_cols("green"))
    
    ```
    
    
    <<<<<<< HEAD
    ### Ticket Médio {.value-box}
    =======
    ### Produtos na cesta {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    recorr_mean_ticket <- 7.1
    
    valueBox(value = round(recorr_mean_ticket, 1), 
             icon = "ion-today-outline",
             color = ic_cols("green"))
    
    ```
    
    Row
    -----------------------------------------------------------------------
    
    ### Clientes no grupo alvo {.value-box}
    
    ```{r}
    
    churn_n <- 15248
    valueBox(value = prettyNum(churn_n, big.mark = ' '), 
             icon = "ion-people-outline",
             color = ic_cols("orange"))
    
    ```
    
    
    <<<<<<< HEAD
    ### Média de compras por cliente {.value-box}
    =======
    ### Compras por cliente {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    churn_mean_compra <- 3.3
    
    valueBox(round(churn_mean_compra, 1), icon = "fa-carrot",
             color = ic_cols("orange"))
    
    ```
    
    
    <<<<<<< HEAD
    
    ### Média de dias entre compras -box}
    =======
    ### Dias entre compras {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    churn_mean_days <- 28.4
    
    valueBox(round(churn_mean_days, 1), icon = "ion-today-outline",
             color = ic_cols("orange"))
    
    ```
    
    
    <<<<<<< HEAD
    ### Ticket Médio {.value-box}
    =======
    ### Produtos na cesta {.value-box}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r}
    
    churn_mean_ticket <- 3.3
    
    valueBox(value = round(churn_mean_ticket, 1), 
             icon = "ion-today-outline",
             color = ic_cols("orange"))
    
    ```
    
    <<<<<<< HEAD
    =======
    
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    Row
    -----------------------------------------------------------------------
    
    ### Distribuição
    
    <<<<<<< HEAD
    ```{r avg_days}
    
    ggplotly(hist_ma)
    =======
    ```{r avg_days, out.width = "100%"}
    
    #ggplotly(hist_ma)
    
    hist_ma
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```
    
    
    
    
    <<<<<<< HEAD
    
    
    
    
    
    =======
    
    
    
    
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    
    
    
    
    
    
    
    
    
    
    
    <<<<<<< HEAD
    ### Frequência
    
    ```{r heatmap}
    
    ggplotly(hm_total)
    
    ```
    =======
    
    
    
    
    
    
    
    
    
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    
    
    
    
    
    
    
    
    
    
    
    
    <<<<<<< HEAD
    Departamentos 
    =========================================
    
    Row
    -----------------------------------------------------------------------
    
    ### Análise 1
    
    ```{r}
    ```
    
    
    ```{r}
    ```
    
    
    Produtos e Carrinho de Compras {.storyboard}
    =========================================
    
    ### Heatmap - Consumidores Churn
    =======
    Produtos {.storyboard}
    =========================================
    
    ### Heatmap - Consumidores Churn {data-commentary-width=400}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```{r heat_churn}
    
    include_graphics("img/Heat_Churn.png")
    
    <<<<<<< HEAD
    
    
    =======
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    #ggplotly(hm1, tooltip = "perc")
    
    ```
    
    - 1	Sparkling Water
    - 2	**Sweet Kale Salad Mix**
    - 3	Red Onion
    - 4	Pure Irish Butter
    - 5	Bunched Cilantro
    - 6	Baby Cucumbers
    - 7	Roma Tomato
    - 8	Fat Free Milk
    - 9	Garlic
    - 10	Natural Spring Water
    - 11	**Vanilla Almond Breeze Almond Milk**
    - 12	**Organic Extra Virgin Olive Oil**
    - 13	Packaged Grape Tomatoes
    - 14	Jalapeno Peppers
    - 15	Orange Bell Pepper
    - 16	**Sharp Cheddar Cheese**
    - 17	Smartwater
    - 18	**Roasted Pine Nut Hummus**
    - 19	Sparkling Mineral Water
    - 20	**Cereal**
    - 21	**Extra Fancy Unsalted Mixed Nuts**
    - 22	Green Onions
    - 23	Organic Low Fat Milk
    
    ***
    
    - **HIPÓTESE:**
    <<<<<<< HEAD
    - Existe uma relação entre a posição do produto no carrinho e a recorrência de compra
    
    - **PREMISSA DA ANÁLISE:**
    
    Separar os clientes em 2 catergorias: Clientes Churn e clientes muito recorrentes.
    Essa definição inicial é feita com base na variável 'days_since_pior_order'. 
    Primeiro se calcula a média móvel a cada 5 compras, por user_id.
    Uma vez definidas as médias móveis por cliente, calculam-se os quartis.
    
    * Clientes Churn: 
    
        + Clientes < 5 compras: Média simples >=25 dias
        
        + Clientes >= 5 compras: Última média móvel = 30
        
    * Clientes Recorrentes: aqueles que estão acima da mediana.
    
    Definido isso, será feita uma análise para cada um dos grupos de modo a buscar as discrepâncias.
    
    - **GRÁFICOS:**
    Foram criados 2 Heatmaps, um para cada grupo de clientes, onde são apresentados os percentuais de recorrencias de produtos (100 produtos de maior recorrência de compra), nas diferentes posições do carrinho de compras.
    =======
    - Relação entre a posição do produto no carrinho e a recorrência de compra
    
    - **PREMISSA DA ANÁLISE:**
    
    Categorias:
    
    * **Clientes Churn**: 
    
        + Clientes < 5 compras: Média simples >= 25 dias
        
        + Clientes >= 5 compras: Última média móvel = 30
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    - **INSIGHTS:**
    * Clientes em Churn tem um perfil de compra muito diferente do grupo recorrente.
    
    * Média de Produtos na cesta: Churn = 3,32 | Recorrentes = 7,13
    
    * Tipos de produtos na cesta: 
    
    <<<<<<< HEAD
        + Churn: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho
        
            - Atenção para o alto percentual desses produtos na primeira posição da cesta.
            
            - Há vários produtos que nunca apareceram em lugares mais altos da cesta. Sugere que não fazem compras, e sim pedem produtos avulsos.
            
        + Recorrentes: Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho
        
            - Muito mais orgânicos
        
    
    
    ### Heatmap - Consumidores Recorrentes
    =======
        + **Churn**: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho
        
            - Alto percentual desses produtos na primeira posição da cesta.
            
            - Produtos que nunca apareceram em lugares mais altos da cesta: Sugere que não fazem compras, e sim pedem produtos avulsos.
            
    
    
    ### Heatmap - Consumidores Recorrentes {data-commentary-width=400}
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    
    ```{r heat_recorr}
    
    include_graphics("img/Heat_Recorr.png")
    
    ```
    
    - 1 **Organic Kiwi**
    - 2	**Organic D'Anjou Pears**
    - 3	**Organic Garnet Sweet Potato (Yam)**
    - 4	**Organic Navel Orange**
    - 5	100% Raw Coconut Water
    - 6	**Organic Bartlett Pear**
    - 7	Grated Parmesan
    - 8	Grape White/Green Seedless
    - 9	Extra Virgin Olive Oil
    - 10	**Organic Sticks Low Moisture Part Skim Mozzarella String Cheese**
    - 11	**Organic Milk**
    - 12	**Organic Large Brown Grade AA Cage Free Eggs**
    - 13	Clementines, Bag
    - 14	Granny Smith Apples
    - 15	**Organic Fat Free Milk**
    - 16	Total 2% with Strawberry Lowfat Greek Strained Yogurt
    - 17	Bartlett Pears
    - 18	**Organic Carrot Bunch**
    - 19	Pure Sparkling Water
    - 20	*Whipped Cream Cheese*
    - 21	*Shredded Parmesan*
    - 22	**Organic Broccoli Florets**
    - 23	**Organic Black Beans**
    
    ***
    
    - **HIPÓTESE:**
    <<<<<<< HEAD
    - Existe uma relação entre a posição do produto no carrinho e a recorrência de compra
    
    - **PREMISSA DA ANÁLISE:**
    
    Separar os clientes em 2 catergorias: Clientes Churn e clientes muito recorrentes.
    Essa definição inicial é feita com base na variável 'days_since_pior_order'. 
    Primeiro se calcula a média móvel a cada 5 compras, por user_id.
    Uma vez definidas as médias móveis por cliente, calculam-se os quartis.
    
    * Clientes Churn: 
    
        + Clientes < 5 compras: Média simples >=25 dias
        
        + Clientes >= 5 compras: Última média móvel = 30
        
    * Clientes Recorrentes: aqueles que estão acima da mediana.
    
    Definido isso, será feita uma análise para cada um dos grupos de modo a buscar as discrepâncias.
    
    - **GRÁFICOS:**
    Foram criados 2 Heatmaps, um para cada grupo de clientes, onde são apresentados os percentuais de recorrencias de produtos (100 produtos de maior recorrência de compra), nas diferentes posições do carrinho de compras.
    
    - **INSIGHTS:**
    * Clientes em Churn tem um perfil de compra muito diferente do grupo recorrente.
    
    * Média de Produtos na cesta: Churn = 3,32 | Recorrentes = 7,13
    
    * Tipos de produtos na cesta: 
    
        + Churn: Predominantemente Bebidas e laticínios (água, leites e Soda) como principais itens do inicio do carrinho
        
            - Atenção para o alto percentual desses produtos na primeira posição da cesta.
            
            - Há vários produtos que nunca apareceram em lugares mais altos da cesta. Sugere que não fazem compras, e sim pedem produtos avulsos.
            
        + Recorrentes: Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho
        
            - Muito mais orgânicos
    
    ### Dendro Clientes Churn
    
    ```{r dend_Churn}
    
    # library(imager)
    # myimg <- load.image("tanglegrama1.png")
    # plot(myimg)
    include_graphics("img/Dend_Churn.png")
    ```
    
    ### Dendro Clientes Recorrentes
    
    ```{r dend_Rec}
    
    # library(imager)
    # myimg <- load.image("tanglegrama1.png")
    # plot(myimg)
    include_graphics("img/Dend_Recorr.png")
    =======
    - Relação entre a posição do produto no carrinho e a recorrência de compra
    
    - **PREMISSA DA ANÁLISE:**
        
    * **Clientes Recorrentes**: aqueles que estão acima da mediana de quantidade de pedido.
    
    
    - **INSIGHTS:**
            
      **Recorrentes**: 
      
      - Cesta mais dispersa, porém com maior quantidade de Hortifruti (Bananas, leites e Soda) como principais itens do inicio do carrinho
        
      - Muito mais orgânicos
            
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
     
    Corredores
    =======================================================================
    
    ### Churn
    
    ```{r}
    
    include_graphics("img/Churn_Aisle.png")
    
    ```
    
    ### Recorrentes
    
    ```{r}
    
    include_graphics("img/Recorr_Aisle.png")
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392
    
    ```
    
    
    <<<<<<< HEAD
    Pesquisa
    =========================================
    
    
     
    =======
    Próximos Passos
    =======================================================================
    
    ### Possibilidades
    
    ```{r}
    
    include_graphics("img/ppt/Slide5.png")
    
    ```
    
    
    Perguntas
    =======================================================================
    
    ### Perguntas
    
    ```{r}
    
    include_graphics("img/ppt/Slide6.png")
    
    ```
    
    
    
    >>>>>>> 25b429b07af68f019b8e1a6e30eaead35878b392